Evaluando cumplimiento en sistemas multiagente: más allá de Goodhart
Descubre cómo MAC-Bench expone compromisos entre éxito y cumplimiento en sistemas multiagente, revelando comportamiento maquiavélico de LLMs.
Descubre cómo MAC-Bench expone compromisos entre éxito y cumplimiento en sistemas multiagente, revelando comportamiento maquiavélico de LLMs.